0%

The Hidden Pattern Behind Everything We Do

s10579445.jpg

人类行为93%是可以预测的——大数据时代预见未来的新思维

爆发

作者: [美] 艾伯特-拉斯洛·巴拉巴西
出版社: 中国人民大学出版社
副标题: 大数据时代预见未来的新思维
原作名: Bursts: The Hidden Pattern Behind Everything We Do
译者: 马慧
出版年: 2012-6
页数: 310
定价: 59.90元
装帧: 平装
ISBN: 9787300154749

内容简介 · · · · · ·

  1. 本书是一本超越《黑天鹅》的惊世之作。如果说塔勒布认为人类行为是随机的,都是小概率事件,是不可以预测的;那么全球复杂网络权威Barabasi则认为,人类行为93%是可以预测的。

  2. Barabasi的研究是在人类生活数字化的大数据时代基础上进行的,移动电话、网络以及电子邮件使人类 行为变得更加容易量化,将我们的社会变成了一个巨大的数据库。他认为,人类正处在一个聚合点上,在这里数据、科学以及技术都联合起来共同对抗那个最大的谜题——我们的未来。

  3. 在本书中,Barabasi揭开人类行为背后隐藏的模式“爆发”,提出人类日常行为模式不是随机的,而是具有“爆发性”的。爆发揭开了人类行为中令人惊讶的深层次的秩序,使得人类变得比预期中更容易预测得多。

4.爆发模式的揭示,其影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。

作者简介 · · · · · ·
艾伯特-拉斯洛•巴拉巴西(Albert-Laszlo Barabasi)

 全球复杂网络研究权威,无尺度网络的创立者。美国物理学会院士,匈牙利科学院院士,欧洲科学院会员,美国东北大学教授,网络科学研究中心的创始人、主任,同时任职于哈佛大学媒体学院医学系,并担任丹那-法 伯癌症研究所癌症系统生物学中心的研究员。

 Barabasi提出无尺度网络模型,2006年因此荣获了匈牙利计算机学会颁发的冯•诺依曼金质奖章,是建立基于网络共性的统一科学理论的先行者,是复杂网络界引述最多的科学家。

 世界著名科技杂志《popular science》杂志称赞 Barabasi“他可以控制世界”。

目录 · · · · · ·
推荐序一
推荐序二 在科学和历史之间
姜奇平 中国社科院信息化研究中心秘书长、《互联网周刊》主编
推荐序三 不在爆发中爆发,就在沉默中沉默
周涛 电子科技大学互联网科学中心教授、博士生导师
引言 人类行为93%是可以预测的
虽然万事皆显出自发偶然之态,但实际上它远比你想象中容易预测。马克•吐温曾说过:历史不会重演,但却自有其韵律。忘掉那些将生命看做掷骰子或是巧克力盒的比喻,把自己想象成处于自动驾驶状态的做着美梦的机器人,你就会更加接近真相。
【选举产生新教皇】

第一部分 人类行为预测不是什么
第1章 在无数个“显微镜”下现形
不是扩散理论
人类跟悬浮在水中的花粉微粒其实没什么不同。我们大部分时间也是运动不止。不同的是,我们不是受到微小而不可见的原子的撞击,而是被转化成一系列任务、责任以及动机的不可见的神经元的颤动所驱使。很多新工具都能追踪人类的活动,都能预见我们的下落:不是当下的,而是未来的。
【决斗在贝尔格莱德】
第2章 15分钟,36分钟,还是36小时
不是转化模型
安迪•沃霍尔说:“未来每个人都有15分钟的成名机会。”然而一只无形的手在放慢人类左右的进程,在今天这个信息饥渴的时代,一条新闻在多长时间之内才算新?我们真的能度量转瞬即逝的成名吗?
【血腥预言】
第3章 是接受绝望,还是追随希望
不是量子力学
如果有透视未来的千里眼,历史不会重演,人类的动机和欲望也不会重复:我们总是想要更好、更多、更不一样的东西。正如我们以揭开次原子世界的真相为目标进行的物理研究一样,是不是说人类就会变得完全或部分可预测?
【圣战奇兵】
第4章 上帝从不掷骰子
不是泊松分布
只要遇到无法理解的事情,我们就会说那是偶然,似乎这种表面上的偶然行为推动了历史的演进,而事情发展之迂回曲折似乎如掷骰子一般。但这种偶然真正意味着什么呢?
【一场始料不及的大屠杀】
第二部分 爆发: 人类行为背后的隐藏模式
第5章 爆发,无处不在
爆发的本质规律:幂律分布
长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经济公司的交易;从人和动物的睡眠模式,到魔术师为了保证魔杖时刻停留在空中而进行的小动作,所有的一切都证明:爆发点无处不在。
【内格雷克之战】
第6章 请学会偶尔说“不”
爆发的起点1:优先级模型
时间是我们最宝贵的不可再生资源,如果我们尊重它,就必须设定优先级。一旦优先级设定了,幂律规律和爆发的出现就不可避免。优先清单会帮你剔除无关紧要的事,帮我们把烦心的日常琐事转化成永远排队的异常值,让我们的注意力集中到真正重要的事情上去。
【圣十字架从不发生意外】
第7章 来一次爱因斯坦式的时空穿越
爆发的起点2: 信件模型
我们发现了前电子时代人们通信的基本模式,而实际上,不管我们的信息是在电脑上以光速传播,还是用蒸汽机船慢慢地漂洋过海,我们的通信模式都是一样的,就连伟大的爱因斯坦也不例外……
【调查】
第8章 在陌生的地方重新开始
爆发的轨迹1:信天翁模型
从人类记忆的搜寻到网络的信息查找,一切已经证明,查找某个特定目标的最佳策略不是最明显、最系统、最规律的搜寻模式,而是具有爆发性、间歇性,甚至是偶然性的搜寻模式。
【“恶棍!”】
第9章 我们不会永远漂泊
爆发的轨迹2:手机模型
手机数据帮我们解决了这个自相矛盾的问题:如果人类活动遵循列维模式,我们就永远找不到回家了路,但实际并非如此。事实证明我们不会永远漂泊。我们逃脱了定律的诅咒,每次都能回到家中。
【革命吧!】
第10章 每个人都是习惯的奴隶
爆发的频率:熵
我们到底有多好预测?我们最终能够为这个一直困扰我们的问题给出一个定量的答案了。虽然人与人存在很多不同,但我们的可预测程度都差不多,无情的统计规律使得异类根本不存在。我们的行踪都深受规律影响,而且它的影响力比我们想象中要大得多。
【特兰西瓦尼亚牵制战】
第三部分 谁掌控着我们的未来
第10章 数据,是一把双刃剑
爆发来到大数据时代
虽然我们的过去由安全防火墙和隐私法保护着,但通过精密系统的预测,我们的未来却极易被人掌握。未来比过去更具价值,那么谁掌握着我们未来行为的信息?谁又会从中获利?
【塞克勒人VS. 塞克勒人】
第11章 爆发的世界里没有黑天鹅
爆发,生命奇迹的必要因素
生命远不是流畅或随机的,而是在所有时间尺度内都具有爆发性的——从几毫秒到几小时的细胞活动;从几分钟到几周的人类活动模式;从几周到几年的疾病来袭;从几千年到几百万年的进化过程。爆发,是生命奇迹的必要因素,是生物为了适应和存活所进行的不懈斗争。
【决战】
结语 爆发,宇宙运行的科学
我们正在一个聚合点上,在这里数据、科学以及技术都联合起来共同对抗那个最大的谜题——我们的未来,既是个人的又是社会的。无处不在的爆发,是科学的台柱,而它的影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。
【血肉之躯】

爆发–人类的行为真的可以预测吗?

93%!

这本书的作者艾伯特-拉斯洛·巴拉巴西要告诉我们的一个结论就是:人类行为93%是可以被预测的,只要我们有足够多对个人行为模式的数据采集,在现在这个数字化时代,你又有什么行为模式没有留下数字化痕迹呢?

巴拉巴西用了一本书絮絮叨叨讲了好几个故事,还把一本书写成了他的研究和历史小说的穿越混搭(这点倒是超出我的93%的预测之外),就是为了告诉你,他是费了多大努力,才发现:

因为个人的行为模式是因为每个个体都排了一下优先级,所以当一个人任务越多,就越可能累积一些优先级不重要的工作,那么他会选择在一个时间段快速处理完这些工作,看起来,这种个人工作的特点就呈现了一种阶段爆发式的特点,更具体的说,遵从了幂律数学法则,你看,哪里都少不了《数学之美》。

当一个人的行为能够被预测的话,我们可以开始做哪些漂亮的工作?

巴拉巴西告诉你,这当然可以,不过这也刚刚开始,你赶紧来,下一场狂欢是属于大数据时代的,显然他还得写一本书。

在我看来,巴拉巴西的解释除了发现大部分人的行为模式不是泊松分布而是幂律分布外,并没有告诉我们什么特别值得新奇的东西,甚至幂律规律也不是什么特别神奇的玩意,我早就知道我是这习惯,比如我大学时期,总是把衣服累积到一大桶才批发处理,这种生活经验不需要太可以观察就可以发现。

我们很早就知道“三岁看到老”,一个人的行为是可以通过其个性进行推断和预测的,越是封闭的生活圈,一个人的行为就越容易被预测,别说大数据时代,我现在随时就可以告诉你我老爷子一天的行程,如果没有来客人或者生病,这个预测准确度也不会低于93%。

说实在的,人是自己习惯的奴隶,所以一个人的言行能被一定程度预测非常正常,在大数据观察的帮助下,能够达到过去无法期望的预测精准度也很正常。但是人之所以为人,就在于人的内心的不可预知和持续演变,这种演变给世界带来种种可能,也带来无数不可预测性,这本来就是一对矛盾。

我觉得巴拉巴西提出一个幂律规律,唯一的价值对我是可以用在时间管理术的教学中,对于预测人类或者个人的行为模式,他没有解释的关键问题是:

1、一个人的行为93%可预测并不可怕,也许让一个人一辈子都记忆深刻的事情,且不说是后悔还是幸福,也许来自那7%不可预测的行动,我的意思是怎样评估那7%对一个人行为预测的权重呢?

2、个人的行为模式分布特点如何成为群体行为模式预测的基础?93%的个体行为能被预测未必就能告诉我们关于未来的答案,因为很可能是那7%的无法预测的人改变了人类,比如你们都喜爱的乔布斯,或者咱们国家的毛泽东,谁能预测他们呢?但他们改变了世界。

几个作者没写的问题

  1. 爆发的出现,往往是从无序变成有序的临界点,一旦系统被迫发生相变,一切随时改变,随即出现幂律(爆发)。节点也由无规则分布到社会化分布。

  2. 无尺度网络有的两个特征是增长和优先情结,这会造就马太效应,富者越富;而合理利用适用性,是后来者打破这个法则的关键。

  3. 引爆点往往来自连接者,连接者是引爆流行的真正原因。

  4. 市场具有自我组织的魔力,比如亚当斯密的看不见的手和哈耶克的自发性秩序,系统科学将其定义为自组织,自组织现象一旦诞生,就会倾向于自我发展和演化,所以我们常常误以为短期出现的一些现象,会长期演化下去。

  5. 人类是天生具有合作能力的,也可以理解为互惠性、同理心,典型的例子就是朋友圈的鸡汤文,人类互惠性的目标是建立声誉,积累好处。人类历史就是一场在合作能力强或者弱的群体之间的斗争,合作能力强的胜出。

  6. 当人们越自由的时候,越会相互模仿,一个赋予个体无限自由的社会,往往会达到令人惶恐的同一性,这就是环境的威力。

  7. 对于一个爆发的系统来说,基本的特征包括:长期的高可预测性和短期的低可预测性;整体的结构性和局部的随机性。

可以用大数据把握人性吗

可以用大数据把握人性吗——互联网周刊作者:姜奇平

美国物理学会院士巴拉巴西的新著《爆发》,是讨论大数据问题的最新一部商业论著,可以被视为大数据的商业哲学。

作为复杂网络研究的权威,巴拉巴西在大数据兴起的背景下,得出一个结论性的判断,认为数据、科学以及技术的合力,会使得人类变得比预期中更容易预测得多。这无疑会增强人们对Facebook所做的时间轴(Timeline)这类商业创新的信心。

这本书除了从现象上讨论大数据将带来的商业影响外,特别深入浅出地提炼出大数据背后的一个基本面上的哲学问题。《爆发》在最新的时间、最新的领域,讨论了一个最古老的问题:到底应该用决定论的观点,还是用非决定论的观点,看待人类行为?
这本书写法非常奇特,每章由科学和历史两部分交织组成。科学的部分讨论用大数据能否测准人类行为,就象物理学家讨论测不准定理一样。历史的部分用故事说明人类行为确曾被不可思议地测准过。

这本书的历史部分写得非常富有趣味和悬念,我是象看金庸的武侠小说那样,一口气读下来的。它差不多就是一部小说,情节是如此吸引人,以至看到一半,我开始扔掉每章的前半部分,专看“小说”部分,一直看到主人公赛克勒被处死的大结局。这种感觉有点象看电视连续剧,被“欲知后事如何”吸引得顾不上按部就班一集一集观看,直接到百度去搜分集剧情简介,先睹为快。

故事讲的是匈牙利十字军的一段历史,主人公赛克勒受主教之命,征召农民组成十字军。在出征半路上,与同为十字军的贵族军发生一场至今也没搞清原因的“误会”。结果大水冲了龙王庙,十字军内部草根与精英打了起来,贵族军杀了两千农民军。这一事变,将赛克勒激反,走上领导草根起义之路。国王身边的泰勒格迪事先曾准确预言事情的走向,他认为,主教发动农民军充当十字军过于冒险,因为这些农民从军主要并非为了信仰,而是为了摆脱贵族劳役,他们手中有了武器,一旦遇到突发事件就有掉头将矛头直指国王和贵族的危险。这样的事情结果还真发生了。可惜农民军在造反打下大半个匈牙利后,最终被贵族军镇压,赛克勒兵败被擒,坐上“燃烧的御座”,带上烧红的铁制王冠,被当众处死。

这本书虽然可以当历史小说来看,但它的重心在每章的前半部分,即讨论科学的部分。历史故事只是为了证明作者的观点:人类行为90%是可以预测的,就象泰勒格迪做到的那样。

在日趋精密的数字技术条件下,有了从四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。人类行为遵循着一套简单并可重复的模型,而这些模型受制于更加广泛的规律。

巴拉巴西这里讲的实际是语义网络的道理。根据语义网络理论,一个词最初有许多歧义,但一旦被放在由它的上下文编织的语境网络中,它的微言大义就会被精确锁定。

如果把人类行为比喻成这个词的话,人的内心想法十分微妙,往往只可意会不可言传,说出就是错,自身都可能都搞不清楚自己想要的到底是什么。但借助大数据,可以象解梦那样,把这种潜意识层面的不可道之道,借助种种蛛丝马迹,判断出来。
爆发的规律,被作者视为宇宙运行的科学。人类行为并不象自然界那样多是随机运动,而可能在意向作用下表现出非常规的突变的行为。例如,赛克勒出兵时压根就没想过起义,但当手下两千人被“自己人”残杀时,一怒之下导致了爆发,结果目标从对外转成了对内。

爆发是那种脱离自然常规,但符合人的规律的行为。对农民军来说,爆发具有内因,这个内因就是泰勒格迪看到的那个基本面上的原因,即农民因受压迫而产生对贵族的仇视。作者认为,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。我们都具有爆发式,而且非常规律。看上去很随意、很偶然,但却极其容易被预测。

如果我们把泰勒格迪不是当作一个人,而是当作一种大数据机制,泰勒格迪无非就是通过经验数据的搜索、分析、挖掘,最终猜测赛克勒们的爆发行为的一套人工智能机理的象征。从这个意义上说,Facebook的时间轴就是个泰勒格迪。

巴拉巴西的观点虽然独特,但并没有从哲学的谱系中逃逸。作者采用的“科学-历史”叙事框架,正构成本书所涉及问题的元问题本身。当科学和历史被“主义”化为科学主义和历史主义时,二者的对立构成的是一个老问题:自然是决定论的,历史是非决定论的。如果把社会发展当作一个自然过程,作为科学的对象,它是有规律、可预测的;如果把社会发展当作一个历史过程,作为(历史主义的)历史学的对象,它是无规律、不可预测的。介于二者之间的观点认为,社会发展是一个自然历史过程。
按巴拉巴西的观点,自然与历史的比重,大约应是90%与10%的关系。这就不难理解,作者对波普尔的观点——否定历史决定论的观点——基本是否定的。由此可以看出巴拉巴西观点在哲学上的大致定位。

作为《链接》一书的作者,巴拉巴西还是一位知名的网络问题专家。《爆发》一书的新意,并不在于提出了新的历史观,而在于结合科学技术发展新的事实,对特定历史观进行了重新论证。作为网络研究者,我对此也很感兴趣。尤其其中涉及的大数据,正是下一步互联网发展的重要方向,Facebook推出的时间轴(Timeline)与本书反复提到的Lifelinear都是当前网络前沿的时尚,代表着人工智能实践的新进展。

就此谈谈我个人的判断。书中说到的技术事实的部分是可信的。例如谈及手机运营商掌握着我们的实时通信信息和行踪等。其实网络实践比书中说的更为丰富。目前,这种可供分析人类行为的“泰勒格迪”系统主要有几大类,

一类是采集分析个人的地球上的全部运动轨迹(通过LBS采集);一类是采集分析个人的全部支付记录(通过在线支付采集);一类是采集分析个人的全部交往记录(通过SNS采集);一类是采集分析个人的全部言行记录(通过邮件、文档、Timeline、视频监控等采集)。 商家通过这些数据,确实可以预测客户的行为,从而提供有别于他人的个性化服务。从这个意义上来说,巴拉巴西的预言是有道理的。

但是,这些事实是否足以改变“决定论-非决定论”这个水平上的哲学结论,每个人可能都会有自己的判断。人具有自由意志,这是不同于分子随机运动之处。如果泰勒格迪成了国王,所有的人是不是都应变为宿命论者?我们有可能成功预测到一个沉默的人在某个时刻突然爆发,但要猜透这个人的斯芬克斯之谜,光有科学和技术可能还是不够的。物理学家也许希望发现历史的宿命,但人通过知识获得解放,不仅是为了排除不可能的自由,更是为了增加可能的选择。

我宁愿赌大数据不会使人类陷于宿命,大数据只是把人性中可预测的部分外包给机器,让人将自由更聚焦于只属于自己的独一无二的部分。

欢迎关注我的其它发布渠道